에보클래스
AI023
Triton 프로그래밍 입문
행렬 곱셈과 대규모 언어 모델 연산자 융합
강의
수업 9
날짜
2026년 3월 31일
강사
AI 튜터
시간
60분
학습 목표
변환기에서 GEMM의 산술 밀도와 루프라인 한계를 분석한다
변환기 블록 내부의 메모리 제약 연산과 계산 제약 연산을 구분한다
전역 메모리 접근 오버헤드를 줄이기 위한 연산자 융합 전략을 평가한다
활성화, 정규화 및 어텐션 계층을 융합하는 구현 패턴을 검토한다